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ZUSAMMEHFASSUNG 



Datenverarbeitungseinrichtung 

In Verbindung mit einer Datenverarbeitungseinrichtung, wo- 
bei ein (im folgenden Datenf luBprozessor - DFP - genannter) 
integrierter Schaltungskreis (Chip) mit einer Vielzahl ins- 
besondere orthogonal zueinander angeordneter homogen struX- 
turierter Zellen mit je einer Mehrzahl jeweils logisch 
gleicher und strukturell identisch angeordneter Bausteine 
vorgesehen ist, dessen Zellen zeilen- und spaltenweise, ge- 
gebenenfalls gruppenweise zusammengefaBt , mit Ein- / Aus- 
gangsanschlUssen des integrierten Schaltkreises verbunden 
sind, ist erf ingungsgemaB den Zellen eine Ladelogik zuge- 
ordnet ist, Uber die sie je fUr sich und gegebenenf alls 
gruppenweise zusammengefaBt so programmierbar (konfi- 
gurierbar) sind, daB beliebige logische Funktionen und/ Oder 
Vernetzungen untereinander verif izierbar sind, und zwar 
derart, daB eine Manipulation der DFP-Konf iguration wahrend 
des Betriebes (oder zur Lauf zeit) , d.h. die Modifikation 
funktioneller Teile (MACROS) des DFPs erfolgen kann, ohne 
daB andere funktionelle Teile angehalten werden roiissen oder 
in ihrer Funktion beeintrSchtigt werden. 
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Datenverarbeitungseinrichtung 
BESCHREIBUNG 

Die vorliegende Erfindung bezieht sich auf eine Daten- 
verarbeitungseinrichtung, d.h. eine Hardwareeinheit zur 
logischen Manipulation (VerknQpf ung) von in binSrer Form 
vorliegenden Daten (Informationen) . 

Derartige Datenverarbeitungseinrichtungen sind mittlerweile 
lange bekannt und sie haben bereits breite Anwendung und 
Anerkennung gefunden. Die prinzipielle Aufbau- und Arbeits- 
struktur der bekannten Datenverarbeitungseinrichtungen ist 
in etwa so zu definieren, daB eine arithmetisch-logische 
VerknUpfungseinheit vorgesehen ist, in der die zu verknilp- 
fenden Daten einer programmtechnischen Anweisung (Software) 
zufolge verarbeitet werden. Die Daten werden dabei Uber ein 
Steuerwerk in mehr oder weniger komplexen Adressierungs- 
vorgSngen entsprechend abgerufen und zunSchst in Arbeits- 
registern bereitgestellt; nach der logischen Verkniipfung 
werden dann die neuen Daten in einer vorgegebenen Speicher- 
stelle wieder abgelegt. Die arithmetisch-logische Verkniip- 
fungseinheit besteht dabei aus logischen VerknUpfungsbau- 
steinen (Gatter, Glieder) , die jeweils so miteinander ge- 
koppelt sind, daB die zu manipulierenden Daten der zugrunde 
liegenden Software entsprechend den vier Grundrechenarten 
gemSB logisch verarbeitet werden. 

Es ist leicht nachzuvollziehen, daB auf der Basis der be- 
kannten Strukturen relativ viel Rechenzeit dafUr erforder- 



lich ist, die zu manipulierenden Daten auszulesen, und die 
Arbeitsregister zu tiberftihren, den spezifischen Logikbau- 
steinen in der arithmetisch-logischen VerknUpf ungseinheit 
zuzuleiten und schlie31ich wieder abzuspeichern. Es ist 
ferner einsichtig, da3 die Hardware-Struktur der arith- 
metisch-logischen Verkniipf ungseinheit insoweit nicht als 
optimal betrachtet werden kann, als schlieBlich die hard- 
waremSBig vorhandenen integrierten logischen Bausteine 
stets nur in ein und derselben Art und Weise im Gesamt- 
system aktiv benutzt werden. Ebenso wird durch strikte 
Hardwarevorgabe ein Aneinanderreihen von Funktionen in 
sogenannten Pipelines sehr erschwert oder eingeschrankt , 
was zwangslSufig ein haufiges Registerumladen zwischen 
Arbeitsregistern und Rechenwerk bedeutet. Derartige Bau- 
steine sind des weiteren nur schlecht kaskadierbar und er- 
fordern dann sehr viel Programmierarbeit . 

Ein zusatzlicher Vorteil der vorliegenden Erfindung liegt 
darin, dafi eine viber einen weiten Raum skalierbare Paralle- 
litat zur VerfUgung steht. Hierbei wird eine Basis zum 
schnellen und flexiblen Aufbau von neuronalen Strukturen 
geschaffen, wie sie bis dato lediglich mit erheblichem Auf- 
wand simuliert werden konnen. 

Die der vorliegenden Erfindung zugrunde liegende Aufgabe 
besteht darin, eine im folgenden Datenf lufiprozessor (DFP) 
genannte Datenverarbeitungseinrichtung anzugeben, bei der 
eine hohere beziehungsweise bessere Flexibilitat der 
Gesamtstruktur und des Datenflusses sowie der Pipelining- 
und Kaskadiermbglichkeiten zu einer Erhohung der Rechner- 
beziehungsweise VerknUpf ungsleistung fUhrt. 

AuBer dem Einsatz als reiner Datenf luBprozessor , soli der 
DFP folgende weitere Aufgaben erfiillen konnen: 
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Einsatz als universeller Baustein zum Aufbau von her- 
kommlichen Rechnern, wobei der Aufbau einfacher und 
billiger werden soli. 
Einsatz in neuronalen Netzen. 

Diese Aufgabe wird dadurch gelost, daft ein integrierter 
Schaltkreis (Chip) mit einer Vielzahl insbesondere ortho- 
gonal zueinander angeordneter Zellen itiit je einer Mehrzahl 
jeweils logisch gleicher und strukturell identisch angeord- 
neter Zellen vorgesehen ist der en Anordnung, sowie die 
interne Busstruktur^ zur Erleichterung der Programmierung 
SuBerst homogen ist, Dennoch ist es denkbar innerhalb eines 
Datenf luBprozessors Zellen mit verschiedenen Zellogiken und 
Zellstrukturen unterzubringen, um so die Leistungsf ahigkeit 
zu erhohen, indem zuro Beispiel fur Speicheransteuerungen 
andere Zellen als fiir arithmetische Operationen existieren. 
Insbesondere kann fiir neuronale Netze eine gewisse Spe- 
zialisierung von Vorteil sein. Den Zellen ist eine Ladelo- 
gik zugeordnet, iiber die die Zellen je fUr sich und gegebe- 
nenfalls gruppenweise in sogenannte MACROS zusammengef aBt 
so programmierbar sind, daB einerseits beliebige logische 
Funktionen, andererseits aber auch die Verkniipfung der 
Zellen untereinander in weiten Bereichen verif izierbar 
sind. Dies wird erreicht indem jeder einzelnen Zelle ein 
gewisser Speicherplatz zur VerfUgung steht, in dem die 
Konf igurationsdaten abgelegt sind. Anhand dieser Daten 
werden Multiplexer Oder Transistoren in der Zelle be- 
schaltet um die jeweilige Zellfunktion zu gewShrleisten 
(siehe Fig. 12) . 

Mit anderen als im Patentanspruch 1 gebrauchten Worten 
besteht der Kern der vorliegenden Erfindung darin, einen 
Datenf luBprozessor vorzuschlagen, der zellular aufgebaut 
ist und dessen Zellen Uber eine externa Ladelogik im arith- 
metisch-logischen Sinne quasi beliebig neu konfiguriert 
werden kdnnen. Dabei ist es von SuBerster Notwendigkeit, 



da0 die betreffenden Zeilen einzeln und ohne Beeinf lussung 
der Ubrigen Zeilen oder gar einer Stillegung des gesamten 
Bausteins umkonf iguriert warden konnen. Der Datenflufi- 
prozessor gemSB der vorliegenden Erfindung kann so wShrend 
eines ersten Arbeitszyklusses als Addierer und wahrend 
eines spateren Arbeitszyklusses als Multiplizierer "pro- 
grammiert" werden, wobei die Anzahl der fur die Addition 
beziehungsweise die Multiplikation erf orderlichen Zeilen 
durchaus unterschiedlich sein konnen. Dabei bleibt die Pla- 
zierung der bereits geladenen MACROS erhalten; der Lade- 
logik beziehungsweise dem Compiler obliegt es, das neu zu 
ladende MACRO innerhalb der freien Zeilen zu partitionieren 
(d.h. das zu ladende MACRO so zu zerlegen, daB es sich 
optimal einfUgen ISBt) . Die Ablauf steuerung des Programms 
wird dabei von der Ladelogik iibernommen, indem sie gemaB 
dem momentan ausgefUhrten Programmabschnitt die entspre- 
chenden MACROS in den Baustein ladt, wobei der Ladevorgang 
von der spSter beschriebenen Synchronisationslogik mitge- 
steuert wird, indem sie den Zeitpunkt des Umladens fest- 
legt, Daher entspricht der DFP nicht der bekannten von- 
Neumann-Architektur, da die Daten- und Programmspeicher 
getrennt sind. Dies bedeutet jedoch gleichzeitig eine hdhe- 
re Sicherheit, da fehlerhafte Programme keinen CODE, son- 
dern lediglich DATEN zerstoren konnen. 

Urn den Datenf luBprozessor eine arbeitsfahige Struktur zu 
geben, werden einige Zeilen, und zwar unter anderem die 
Eingabe- / Ausgabefunktionen (I/O) und Speichermanagement- 
funktionen vor dem Laden der Programme geladen und bleiben 
fUr gewShnlich wShrend der gesamten Laufzeit konstant. Dies 
ist erforderlich urn den Datenf luBprozessor an seine Hard- 
wareumgebung anzupassen. Die Ubrigen Zeilen werden zu soge- 
nannten MACROS zusammengef aBt und konnen wahrend der Lauf- 
zeit nahezu beliebig und ohne Beeinf lussung der Nachbar- 
zellen umkonf iguriert werden. Dazu sind die Zeilen einzeln 
und direkt adressierbar . 



Um die Umstrukturierung (das Umladen) der Zellen Oder 
MACROS mit der Ladelogik zu synchronisieren, kann - wo 
notwendig, da nur Umgeladen warden darf , wenn die MACROS 
mit ihrer alten Mtigkeit fertig sind - eine Synchronisa- 
tionsschaltung als MACRO auf dam Datenf lufiprozessor unter- 
gebracht warden, die die entsprechenden Signale an die 
Ladelogik absendet. Hierzu kann evantuell eine Modifikation 
der gewohnlichen MACROs von Noten sein, da diese dann der 
Synchronisations-Schaltung zustandsinf ormationen zur Ver- 
fUgung stellen mussen. 

Diese Zustandsinf ormationen signalisieren der Synchronisa- 
tionslogik fUr gewohnlich, da5 einzelne MACROs ihre Aufgabe 
erledigt haben, was aus programmiertechnischer Sicht zum 
Beispiel die Terminierung einer Prozedur oder das Erreichen 
der Terminierungsbedingung einer Schleife bedeuten kann. 
D,h. das Programm wird an einer anderen Stelle fortgesetzt 
und die die Zustandsinf ormation absendenden MACROS konnen 
umgeladen werden. Zudem kann es von Interesse sein, daS die 
MACROS in einer bestimmten Reihenfolge umgeladen werden, 
Hierzu kann eine Wertung der einzelnen Synchronisations- 
Signale durch einen Prioritatsdekoder erfolgen, Eine der- 
artige - einfache - Logik ist in Fig. 13 gezeichnet. Die 
Logik besitzt sieben Eingangssignale durch die die sieben 
MACROS ihre Zustandsinf ormation abgeben. In diesem Fall 
soil 0 fUr "in Arbeit" und 1 fUr "fertig" stehen. Die Logik 
besitzt drei Ausgangssignale, die an die Ladelogik gefUhrt 
werden, wobei der Zustand 000 als Ruhezustand gilt. Liegt 
ein Signal an einem der sieben EingSnge an, so findet eine 
Dezimal-BinSr-Umsetzung statt, so wird zum Beispiel Sync6 
als 110 dargestellt, was der Ladelogik anzeigt, daB das 
MACRO, welches Sync6 bedient, seine Aufgabe beendet hat. 
Liegen gleichzeitig mehrere Synchronisations-Signale am 
Eingang an, so gibt die synchronisationsschaltung das Sig- 
nal mit der hochsten PrioritSt an die Ladelogik weiter; 



liegen zum Beispiel SyncO, Sync4 und Sync6 an, so reicht 
die Syncronistaions-Schaltung zunachst Sync6 an die Lade- 
logik waiter. Nachdem die entsprechenden MACROS umgeladen 
sind und somit Sync6 nicht mehr anliegt wird Sync4 weiter- 
geleitet usw. , Zur Verdeutlichung dieses Prinzips kann der 
Standard-TTL-Baustein 74148 in Betracht gezogen werden. 

Ober die Ladelogik kann der Datenf luBprozessor jeweils 
optimal und gegebenenf alls dynamisch auf eine zu losende 
Aufgabe eingestellt werden. Damit ist zum Beispiel der 
groBe Vorteil verbunden, daft neue Normen oder dergleichen 
einzig und allein durch eine Umprogrammierung des Daten- 
f luftprozessors umgesetzt werden konnen und nicht - wie 
bisher - einen Austausch mit entsprechendem Anfall von 
Elektronikschrott bedingen. 

Die Datenf luftprozessoren sind untereinander kaskadierbar , 
was zu einer beinahe beliebigen Erhohung des Parallelisie- 
rungsgrades, der Rechenleistung, sowie der NetzgroBe in 
neuronalen Netzen fUhrt, Besonders wichtig ist hier eine 
klare homogene Verbindung der Zellen mit den Ein- / Aus- 
gangs-Pins (lO-Pin) der Datenf luBprozessoren, urn mSglichst 
keine EinschrSnkungen auf die Programme zu haben. 

In Fig. 14 ist zum Beispiel die Kaskadierung von vier DFPs 
gezeigt. Sie erscheinen der Umgebung wie ein groBer homo- 
gener Baustein (Fig. 15). Prinzipiell sind damit zwei Kas- 
kadierungsmethoden denkbar: 

a) Nur die lokalen Verbindungen zwischen den Zellen werden 
herausgefllhrt, was im vorliegenden Beispiel zwei 10- 
Pins pro Kantenzelle und vier lO-Pins pro Eckzelle be- 
deutet. Allerdings hat der Compiler/Programmierer zu 
beachten, daB die globalen Verbindungen nicht heraus- 
gefUhrt werden, wodurch die Kaskadierung nicht voll- 
stSndig horaogen ist. (Globale Verbindungen zwischen 
mehreren Zellen, fUr gew5hnlich zwischen einer kom- 



pletten Zellenreihe oder -spalte - siehe Fig. 6 lo- 
kale Verbindungen existieren nur zwischen zwei Zellen) . 
Fig. 16a zeigt den Aufbau innerhalb eines DFPs, Fig, 
17a zeigt die daraus resultierende Kaskadierung von 
mehreren DFPs (drei gezeichnet) , 
b) Die lokalen und globalen Verbindungen werden heraus- 
gefUhrt, was die Anzahl der benotigten Treiber/IO-Pins 
und Leitungen drastisch erhoht, in unserem Beispiel auf 
sechs lO-Pins pro Kantenzelle und zwolf lO-Pins pro 
Eckzelle. Dadurch ist eine vollstandige HomogenitSt bei 
der Kaskadierung gegeben. 

Da die globalen Verbindungen insbesondere bei Verwendung 
der Kaskadierungstechnik b) sehr lang werden konnen, kann 
der unangenehme Effekt auftreten, daB die Zahl der globalen 
.Verbindungen nicht ausreicht, da bekanntlich jede Verbin- 
dung nur von einem Signal genutzt werden kann. Urn diesen 
Effekt zu minimieren, kann nach einer gewissen LMnge der 
globalen Verbindungen ein Treiber eingeschleif t werden. Der 
Treiber hat zum einen eine VerstMrkung des Signals zur Auf- 
gabe, die bei langen Strecken und entsprechend hohen 
Lasten, unbedingt erf order lich ist; zum anderen kann der 
Treiber in Tristate gehen und damit das Signal unterbre- 
Chen. Dadurch konnen die Abschnitte links und rechts, be- 
ziehungsweise oberhalb und unterhalb des Treibers von ver- 
schiedenen Signalen genutzt werden, sofern der Treiber in 
Tristate ist, ansonsten wird ein Signal durchgeschleif t . 
Wichtig ist hierbei, da0 die Treiber der einzelnen globalen 
Leitungen auch einzeln angesteuert werden konnen, d.h, ein 
globales Signal kann unterbrochen sein, das Nachbarsignal 
ist jedoch durchgeschleif t. Somit konnen auf einer globalen 
Verbindung durchaus abschnittweise verschiedene Signale an- 
liegen, wShrend die globale Nachbarverbindung tatsSchlich 
global von ein und demselben Signal verwendet wird (ver- 
gleiche Fig. 22) . 
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Zur besseren Kommunikation zwischen den DatenfluB- 
prozessoren und der Ladelogik konnen sogenannte Shared- 
Memories eingesetzt werden. So konnen zum Beispiel Pro- 
gramme von einer Festplatte, die im lO-Bereich eines Daten- 
f luBprozessors liegt zur Ladelogik durchgereicht werden, 
indem die Datenf luBprozessoren die Daten von der Platte in 
den Shared-Memory schreiben und die Ladelogik sie dort ab- 
holt. Dies ist besonders wichtig, da hier, wie bereits er- 
wahnt, keine von-Neumann- sondern eine Harvardarchitektur 
vor liegt, Ebenso sind die Shared-Memories von Vorteil, wenn 
Konstanten, die im Programm - das im Speicherbereich der 
Ladelogik liegt - definiert sind, mit Daten - die im 
Speicherbetrieb der Datenf luBprozessoren liegen - verkniipft 
werden sollen. 

Weiterbildungen der vorstehend definierten und umschriebe- 
nen Erfindung sind Gegenstand der Unteranspriiche . 

Eine besondere Verwendung des erf indungsgemaBen Daten- 
f luBprozessors ist darin zu sehen, daB er in Verbindung mit 
geeigneten Ein- / Ausgabe-Einheiten einerseits und einem 
Speicher andererseits die Basis fur einen kompletten (kom- 
plexen) Rechner bilden kann, Dabei kann ein GroBteil der 
lO-Funktionen als macros auf dem Datenf luBprozessor 
implement iert werden und es brauchen momentan lediglich 
Spezialbausteine (Ethernet-Treiber , VRAMS..,) extern zuge- 
fUgt zu werden. Bei einer Normanderung oder Verbesserung 
muB dann wie bereits angedeutet nur das MACRO softwaresei- 
tig gewechselt werden; ein Eingriff in die Hardware ist 
nicht notwendig. Es bietet sich hier an, einen IO-(Ein- 
gabe- / Ausgabe-) Stecker festzulegen, tiber welchen dann 
die Zusatzbausteine angeschlossen werden konnen. 

Fig- 20 zeigt den stark vereinfachten Aufbau eines heute 
tiblichen Rechners. Durch den Einsatz eines DFP-Bausteins 
kdnnen erhebliche Telle eingespart werden (Fig. 21), wobei 



die entsprechenden herkommlichen Baugruppen (CPU, Speicher- 
verwaltung, SCSI-, Tastatur- und Videointerf ace, sowie der 
parallelen und seriellen Schnittstellen) als MACROS in die 
kaskadierten DFPs abgelegt werden. Nur die durch einen DFP 
nicht nachbildbaren Teiie wie Speicher und Leitungstreiber 
mit nicht TTL-Pegeln oder fUr hohe Lasten mUssen extern zu- 
geschaltet werden. Durch die Verwendung des DFPs ist eine 
gUnstige Produktion gegeben, da ein und derselbe Baustein 
sehr hMufig verwendet wird, das Layout der Platine ist 
durch die homogene Vernetzung entsprechend einfach. Zudem 
wird der Aufbau des Rechners durch die Ladelogik bestimmt, 
die hier fUr gewohnlich nur zu Beginn der Abarbeitung (nach 
einem Reset) das DFP-Array ladt, wodurch eine gUnstige 
Fehlerkorrektur- und Erweiterungsmoglichkeit gegeben ist. 
Ein derartiger Rechner kann insbesondere mehrere verschie- 
dene Rechnerstrukturen simulieren, indem einfach der Aufbau 
des zu simulierenden Rechners in das DFP-Array geladen 
wird. Zu bemerken ist, dafi hierbei der DFP nicht in seiner 
Funktion als DFP arbeitet sondern lediglich ein hochkom- 
plexes und frei programmierbares Logikarray zur Verfiigung 
stellt, sich hierbei jedoch von herkommlichen Bausteinen in 
seiner besonderen guten Kaskadierbarkeit unterscheidet . 

Ein weiteres Einsatzgebiet des Bausteins ist der Aufbau 
groBer neuronaler Netze. Sein besonderer Vorzug liegt hier- 
bei in seiner hohen Gatterdichte, seiner ausgezeichneten 
Kaskadierbarkeit, sowie seiner HomogenitSt. Ein Lernvor- 
gang, der eine Snderung einzelner axiomatischer Verbin- 
dungen beziehungsweise einzelner Zellfunktionen beinhaltet 
ist auf tiblichen Bausteinen ebenso schlecht durchfiihrbar , 
wie der Aufbau groBer homogener und gleichzeitig flexibler 
Zellstrukturen. Die dynamische Umkonf igurierbarkeit ermog- 
licht erstmalig die optimale Simulation von LernvorgSngen. 

Die vorliegende Erfindung wird im folgenden anhand der 
weiteren Figuren nSher erlautert. Insgesamt zeigen 
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Fig- 1 ein Schaltsymbol fur einen 8-Bit-Addierer ; 

Fig. 2 ein Schaltsymbol fUr einen aus acht 1-Bit- 

Addierern bestehenden 8-Bit-Addierer nach Fig. 1; 

Fig. 3 eine logische Struktur eines 1-Bit-Addierers ent- 
sprechend Fig. 2/ 

Fig. 4 eine Zellenstruktur des 1-Bit-Addierers ent- 
sprechend Fig. 3; 

Fig, 5 einen der Zellenstruktur nach Fig. 1 entsprechend 
aufgebauten 8-Bit-Addierer; 

Fig. 6 ein aus vier Zellen bestehendes unprogrammiertes 
SUBMACRO X (analog einem 1-Bit-Addierer gemaB 
Fig. 4 beziehungsweise Fig. 5) mit den erf order- 
lichen LeitungsanschlUssen; 

Fig, 7 einen Teilausschnitt eines integrierten Schalt- 
kreises (Chip) mit einer Vielzahl von Zellen und 
einem separierten SUBMACRO X gemaB Fig. 6; 

Fig. 8 einen integrierten Schaltkreis (Chip) mit einer 
Orthogonalstruktur einer quasi beliebigen Viel- 
zahl von Zellen und einer extern zugeordneten 
Ladelogik; 

Fig, 9 ein erstes Ausf Uhrungsbeispiel einer Mehrzahl 
miteinander zu einem Rechenwerk gekoppelter 
integrierter Schaltkreise (Datenf luBprozessor) 
nach Fig. 8; 

Fig. 10 ein zweites Ausf uhrungsbeispiel einer Mehrzahl 
miteinander zu einem Rechenwerk gekoppelter 
integrierter Schaltkreise (Datenf luBprozessor) 
nach Fig, 8; 

Fig. 11 ein Ausf Uhrungsbeispiel eines MACRO zur Addition 

zweier Zahlenreihen; 
Fig. 12 einen beispielhaften Aufbau einer Zelle mit 

Multiplexern zur Auswahl der jeweiligen logischen 

Bausteine; 

Fig. 13 eine zum Beispiel mit einem Standard-TTL-Baustein 
74148 ausgefUhrte Synchronisationslogik; 
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Fig. 14 die Kaskadierung von vier DFPs, wobei die Verbin 
dung zwischen den lO-Pins nur schematisch darge- 
stellt sind (tatsachlich bedeutet eine gezeichne 
te Verbindung eine Mehrzahl von Leitungen) ; 

Fig, 15 die durch die Kaskadierung erreichte Homogenitat 

Fig. 16a die Struktur der E/A-Zellen, wobei die globalen 
Verbindungen nicht herausgef iihrt warden, 

Fig. 16b die Struktur der E/A-Zellen, jedoch mit herausge- 
fUhrten globalen Verbindungen; 

Fig. 17a die aus Fig. 16a resultierende Kaskadierung, wo- 
bei eine Eckzelle, sowie die zwei mit ihr kommu- 
nizierenden Treiberzellen der kaskadierten Bau- 
steine (vergleiche hierzu Fig. 14) gezeichnet 
sind; 

Fig. 17b die aus Fig. 16b resultierende Kaskadierung, wo- 
bei eine Eckzelle, sowie die zwei mit ihr kommu- 
nizierenden Treiberzellen der kaskadierten Bau- 
steine (vergleiche hierzu Fig. 14) gezeichnet 
sind; 

Fig. 18a eine Multiplikationsschaltung (vergleiche Fig. 
lla); 

Fig. 18b die interne Struktur des DFPs nach dem Laden 

(vergleiche Fig, lib); 
Fig. 19c die Arbeitsweise des DFPs im Speicher, sowie die 

Zustande der Zahler 47, 49; 
Fig. 19 eine Kaskadenschaltung, wobei der Addierer aus 

Fig. 11 und der Multiplizierer aus Fig. 18 zur 

Steigerung der Rechenleistung hintereinander ge- 

schaltet sind; 

Fig. 20 den stark schematisierten Aufbau eines herkomm- 

lichen Rechners; 
Fig. 21 den moglichen Aufbau desselben Rechners init Hilfe 

eihes Arrays aus kaskadierten DFPs; 
Fig. 22 einen Ausschnitt mit eingezeichneten (Leitungs-) 

Treibern eines DFPs, 
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In Fig. 1 ist ein Schaltsymbol eines 8-Bit-Addierers darge- 
stellt. Das Schaltsymbol besteht aus einem quadratischen 
Baustein 1 mit acht EingSngen A 0...7 fUr ein erstes Daten- 
wort A und acht EingSngen B 0.,.7 fUr ein zweites (zu 
addierendes) Datenwort B. Die jeweils acht EingHnge Ai, Bi 
warden ergSnzt durch einen weiteren Eingang Oein Uber den 
deia Baustein 1 gegebenenf alls ein Obertrag zugeleitet wird. 
Der Baustein 1 hat funktions- und bestimmungsgemaB acht 
Ausgange S 0...7 fUr binaren Summanden und einen weiteren 
Ausgang Oaus fur den gegebenenf alls bestehenden Obertrag. 

Das in Fig. 1 dargestellte Schaltsymbol ist in Fig. 2 als 
Anordnung sogenannter SUBMACROS dargestellt. Diese 
SUBMACROS 2 bestehen je aus einem 1-Bit-Addierer 3 mit je 
einem Eingang fiir die entsprechenden Bits des Datenworts 
und einem weiteren Eingang fur ein Obertragsbit . Die 1-Bit- 
Addierer 3 weisen dariiberhinaus einen Ausgang fUr den 
Summanden und einen Ausgang fur den Obertrag Oaus auf. 

In Fig, 3 ist die binare Logik eines l-Bit-Addierers bezie- 
hungsweise eines SUBMACROS 2 nach Fig. 2 dargestellt. Ana- 
log zu Fig. 2 weist diese Schaltlogik je einen Eingang Ai, 
Bi fUr die konjugierten Bits der zu verkniipf enden Daten 
auf; ferner ist ein Eingang Oein fUr den Obertrag vorgese- 
hen. Diese Bits werden den dargestellten Verbindungen be- 
ziehungsweise VerknUpf ungen entsprechend in zwei ODER- 
Gliedern 5 und drei NAND-Gliedern 6 verknUpft, so daB am 
AusgangsanschluB Si und am Ausgang fUr den Obertrag Oaus 
die einem Volladdierer entsprechenden VerknUpf ungsergeb- 
nisse (Si, Oaus) anstehen. 

Die Erfindung setzt da ein, wo es - wie in Fig. 4 darge- 
stellt - darum geht, das in Fig. 3 gezeigte SUBMACRO 2 oder 
eine oder mehrere beliebige Funktion(en) in geeigneter 
Weise in einer Zellstruktur zu implement ieren. Dies ge- 
schieht auf der Grundlage logisch und strukturell identi- 
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dreiflig Zellen der zur Verfugung stehenden Gesamtheit von 
Zellen einer zellular mit logisch identischem Layout gefer 
tigten Schaltungsplatine seitens der Ladelogik so ange- 
steuert und konfiguriert beziehungsweise programmiert 
werden, da3 diese zweiunddreiUig Zellen ein 8-Bit-Addierer 
bilden. 

In der Darstellung nach Fig, 5 ist Uber eine strichpunk- 
tierte Umrahmung ein SUBMACRO "X" zeichnerisch separiert, 
das letztlich als aus vier einem l-Bit-Addierer entspre- 
chend programmiert en Zellen (10 gema3 Fig. 4) bestehende 
Untereinheit zu betrachten ist. 

Das in Fig. 5 separierte SUBMACRO "X" ist in Fig. 6 als 
Tail eines integrierten Schaltkreises (Chip) 20 gemeinsam 
mit Leitungs- und Datenanschliissen dargestellt. Das SUB- 
KACRO "X" besteht aus den vier Zellen 10 die entsprechend 
der orthogonalen Struktur je Seite vier DatenanschlUsse 
(also insgesamt sechzehn DatenanschlUsse je Zelle) aufwei- 
sen. Die DatenanschlUsse verbinden jeweils bfenachbarte Zel- 
len, so daB ersichtlich wird, wie beispielsweise eine 
Dateneinheit von Zelle zu Zelle durchgeschleust wird. Die 
Ansteuerung der Zellen 10 erfolgt einerseits Uber sogenann- 
te lokale Steuerungen, das sind lokale Leitungen, die mit 
alien Zellen verbunden sind, und andererseits Uber soge- 
nannte globale Leitungen, d.h. Leitungen, die Uber den ge- 
samten integrierten Schaltkreis (Chip) 20 gefUhrt sind. 

In Fig. 7 ist ein vergroBerter Ausschnitt eines integrier- 
ten Schaltkreises 2 0 dargestellt, der mit einem orthogona- 
len Raster von Zellen 10 belegt ist, Wie in Fig. 7 angedeu- 
tet kann so zum Beispiel eine Gruppe von vier Zellen 10 als 
SUBMACRO "X" ausgewahlt und dem l-Bit-Addierer ent- 
sprechend Fig. 4 gemSB programmiert beziehungsweise konfi- 
guriert warden. 
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Ein vollstandiger integrierter Schaltkreis (Chip) 20 ist in 
Fig. 8 dargestellt. Dieser integrierte Schaltkreis 20 be- 
steht aus einer Vielzahl im orthogonalen Raster angeordne- 
ter Zellen 10 und weist an seinen AuBenkanten eine ent- 
sprechende Anzahl von LeitungsanschlUssen (Pins) auf, tiber 
die Signale, insbesondere Ansteuersignale und Daten zuge- 
fUhrt und weitergeleitet werden konnen. In Fig. 8 ist 
wiederum das SUBMACRO "X" gema/i Fig. 5 / Fig. 6 abgegrenzt; 
dartlberhinaus sind auch weitere SUBMACROS separiert, die 
spezifischen Funktionen und Vernetzungen entsprechend zu 
Untereinheiten zusammengef afit sind. Dem integrierten 
Schaltkreis (Chip) 20 ist eine Ladelogik 30 zugeordnet be- 
ziehungsweise Ubergeordnet , Uber die der integrierte 
Schaltkreis 20 programmiert und konfiguriert wird. Die 
Ladelogik 30 teilt letztlich dem integrierten Schaltkreis 
20 mit, wie er arithmetisch-logisch zu arbeiten hat. Bezug- 
nehmend auf die Fig. 1 bis 5 ist in Fig. 8 einerseits das 
SUBMACRO "X" entsprechend Fig, 4 und Fig. 5 hervorgehoben; 
andererseits ist auch ein MACRO "Y" entsprechend Fig. 1 und 
Fig. 2 angezeichnet, das als Einheit einem 8-Bit-Addierer 
entspricht . 

Anhand von Fig. 9 beziehungsweise Fig. 10 soli im folgenden 
eine Rechnerstruktur beschrieben werden, die auf den im 
vorstehenden definierten und erlauterten integrierten 
Schaltkreis 20 aufbaut, 

GemaB dem in Fig, 9 dargestellten ersten Ausf iihrungsbei- 
spiel ist - analog zur Anordnung der Zellen - im Orthogo- 
nalraster eine Mehrzahl von integrierten Schaltkreisen 20 
angeordnet, deren jeweils benachbarte viber lokale BUS- 
Leitungen 21 miteinander gekoppelt beziehungsweise vernetzt 
sind. Die - beispielsweise aus sechzehn integrierten Schal- 
tkreisen 20 bestehende - Rechnerstruktur weist Ein- / Aus- 
gangsleitungen 10 auf, Uber die der Rechner quasi mit der 
AuBenwelt in Verbindung steht, d,h. korrespondiert . Der 
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Rechner gemaB Fig. 9 weist ferner einen Speicher 2 2 auf, 
der dem dargestellten Ausf iihrungsbeispiel entsprechend aus 
zwei separierten Speichern, zusammengesetzt aus jeweils 
RAM, ROM sowie einem Dual-Ported RAM als shared memory zu 
der Ladelogik geschaltet, besteht, die gleichermafien als 
Schreib-Lese-Speicher oder auch nur als Lese-Speicher 
realisiert sein konnen, Der soweit beschriebenen Rechner- 
struktur ist die Ladelogik 30 zu- beziehungsweise Uberge- 
ordnet, mittels der die integrierten Schaltkreise (Daten- 
f luSprozessor) 2 0 programmiert und konfiguriert und ver- 
netzt werden. 

Die Ladelogik 30 baut auf einem Transputer 31, d.h. einem 
Prozessor mit mikrocodiertem Befehlssatz auf, dem seiner- 
seits ein Speicher 32 zugeordnet ist. Die Verbindung 
zwischen dem Transputer 31 und dem Datenf lufiprozessor 
basiert auf einer Schnittstelle 33 fur die sogenannten 
Ladedaten, d.h. die Daten die den Datenf lufiprozessor 
aufgabenspezif isch programmieren und konf igurieren und 
einer Schnittstelle 34 fUr den bereits genannten Rechner* 
speicher 22, d.h. den Shared-Memory-Speicher . 

Die in Fig. 9 dargestellte Struktur stellt so einen kom- 
pletten Rechner dar, der liber die Ladelogik 30 jeweils 
fall- beziehungsweise aufgabenspezif isch programmiert und 
konfiguriert werden kann. Der VollstSndigkeit halber sei 
noch angemerkt, daB - wie in Verbindung mit der Ladelogik 
30 Uber Pfeile angedeutet - mehrere dieser Rechner ver- 
netzt, d.h. miteinander gekoppelt werden konnen. 

Ein weiteres Ausfiihrungsbeispiel einer Rechnerstruktur ist 
in Fig. 10 dargestellt. Im Unterschied zu Fig. 9 sind dabei 
neben den lokalen BUS-Leitungen zwischen den benachbarten 
integrierten Schaltkreisen 20 noch Ubergeordnete zentrale 
BUS-Leitungen 23 vorgesehen, urn zura Beispiel spezifische 
Ein- beziehungsweise Ausgangsprobleme losen zu kbnnen. Auch 



17 



der Speicher 22 (Shared-Memory) ist iiber zentrale BUS- 
Leitungen 23 mit den integrierten Schaltkreisen 20 verbun- 
den, und zwar wie dargestellt jeweils mit Gruppen dieser 
integrierten Schaltkreise. Die in Fig. 10 dargestellte 
Rechnerstruktur weist die gleiche Ladelogik 30 auf, wie sie 
anhand von Fig. 9 erlautert wurde. 

In Verbindung mit Fig. lla soil eine auf erf indungsgemafien 
Datenf luBprozessoren aufgebaute Additionsschaltung erlau- 
tert werden. Ausgegangen wird von zwei Zahlenreihen An und 
Bn fUr sMmtliche n zwischen 0 und 9; die Aufgabe besteht 
darin, die Summe Ci = Ai + Hi zu bilden, wobei der Index i 
die Werte 0 <=n < 9 annehmen kann. 

Bezugnehmend auf die Darstellung nach Fig. lla ist die 
Zahlenreihe An in einem ersten Speicher RAMI abgespeichert 
und zwar zum Beispiel ab einer Speicheradresse lOOOh; die 
Zahlenreihe Bn ist in einem Speicher RAM2 an einer 
Speicheradresse OdfaOh abgespeichert; die Summe Cn wird in 
den RAMI eingeschrieben und zwar unter der Adresse lOOah. 

Es ist ein weiterer Zahler 49 zugeschaltet , der lediglich 
die einzelnen durch die Steuerschaltung f reigegebenen 
Taktzyklen hochzahlt. Dies soli im Weiteren zur Verdeut- 
lichung der Umkonf igurierbarkeit einzelner MACROS ohne 
Beeinf lussung der an der Umkonf igurierung nicht beteiligten 
MACROS dienen. 

Fig. lla zeigt zunachst die eigentliche Additionsschaltung 
40, die aus einem ersten Register 41 zur Aufnahme der 
Zahlenreihe An und einem zweiten Register 42 zur Aufnahme 
der Zahlenreihe Bn besteht. Den beiden Registern 41 / 42 
ist ein 8-Bit-Addierer entsprechend dem in Fig. 1 darge- 
stellten MACRO 1 nachgeschaltet . Der Ausgang des MACRO 1 
fUhrt Uber eine Treiberschaltung 43 zurilck zum Speicher 
RAMI. Die Takt- beziehungsweise Zeitsteuerung der Addi- 
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tionsschaltung 40 erfolgt uber eine von einem Taktgenerator 
T angesteuerte Zeitsteuerung (STATEMACHINE) 45, die mit den 
Registern 41, 4 2 und der Treiberschaltung 4 3 verbunden ist. 

Die Additionsschaltung 40 wird funktional durch eine Adrefi- 
schaltung 46 zur Generierung der Adressdaten fiir die abzu- 
speichernden Additionsergebnisse erganzt. Die Adrefischal- 
tung 46 besteht ihrerseits aus drei MACROS 1 (gemaB Fig. 1) 
zur Bildung der AdreBdaten, wobei diese MACROS 1 wie folgt 
geschaltet sind: Ober jeweils einen Eingang werden die zu 
verkniipfenden Adressen fUr An, Bn, Cn zugefuhrt. Diese 
Adressen werden mit den Ausgangssignalen eines Zahlers 47 
addiert und mit der Statemachine 45 so verknilpft, daB am 
Ausgang die neue Zieladresse ansteht. Der Zahler 47 und der 
Komparator 48 haben dabei die Aufgabe sicherzustellen, daB 
jeweils die richtigen Summanden verknUpft werden und daB 
jeweils am Ende der Zahlenreihen, d.h. bei n = 9 abge- 
brochen wird. Ist die Addition vollendet, so wird in der 
Zeitsteuerung 45 ein STOP-Signal generiert und die Schal- 
tung passiv geschaltet. Ebenso kann das STOP-Signal als 
Eingangssignal fiir eine Synchronisations-Schaltung ver- 
wenden werden, indem die Synchronisationslogik anhand 
dieses Signals erkennen kann, daB die Gesamtf unktion 
"Addieren" gemaB dem nachfolgend beschriebenen MLl Programm 
beendet ist und die MACROS somit durch neue ersetzt werden 
k6nnen (zum Beispiel konnte STOP das Signal Sync5 sein) • 

Der Zeitablauf in der Zeitsteuerung 45 (STATEMACHINE) laBt 
sich dabei wie folgt darstellen, wobei noch anzumerken ist, 
daB in der Zeitsteuerung 45 eine Verzogerungszeit T (in 
Form von Taktzyklen) zwischen der AdreBgenerierung und dem 
Datenerhalt implementiert ist; 



- Im Zyklus 1 wird jeweils der Zahler 47 um 1 erhoht und im 
Komparator 48 wird gepriift, ob n > 9 erreicht ist; syn- 
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chron zu diesen Operationen werden die Adressen fiir A, B 
C berechnet; 

- im Zyklus ( T + 1) werden die Summanden A, B ausgelesen 
und addiert; 

- im Zyklus (T + 2) wird die Summe C abgespeichert . 

Mit anderen Worten heifit dies, dafi die Operationsschleif e 
und die eigentliche Addition gerade ( T + 2) Taktzyklen 
erfordert. Im allgemeinen sind fdr T 2 ... 3 Takte erfor- 
derlich, so daJ3 verglichen mit den herkommlichen Prozes- 
soren (CPU) , die im allgemeinen 50 bis mehrere 100 
Taktzyklen bedingen, eine ganz wesentliche Rechenzeit- 
Reduzierung moglich wird. 

Die anhand von Fig. 11 aufgezeigte Konf iguration soli im 
folgenden Uber eine hypothetische MACRO-Sprache MLl 
nochmals erlautert werden: 

Es existieren die Zahlenreihen An und Bn 
V n: 0 <^ n < = 9 

Es sollen die Summen Ci = Ai + Bi mit I € N gebildet 
werden. 



const n = 9; 
array A [nl 
array B [n] 
array C [n] 

for i = 0 to 
A i; 

C = A 1 = 
next ; 



in RAM [l] 
in RAM [2I 
in RAM ^1] 

n with (A 

A + B; 



at lOOOh; 
at OdfaOh; 
at lOOah; 

[i\ , B [i] , C [i] ) 



RAM 1 ist der 1. Speicherblock 
RAM 2 ist der 2, Speicherblock 
at folgt die Basisadresse der Arrays 



for ist der Schleif enbeginn 
next ist das Schleif enende 

with ( ) folgen die Variablen, deren Adressen durch 

die Zahlvariable i bestimmt werden 
A T folgt die Verzogerungszeit fUr eine Statemachine 

in Taktzyklen 

Das Timing der statemachine sieht demnach 
f olgendermafien aus: 

Zyklus Aktivitat 

1 Zahler erhohen, Vergleich auf > 9 (ja => 

Abbruch) und Adressen fur A, B, C, berechnen 
T + 1 A, B, holen und addieren 
T + 2 Nach C speichern 

Das heifit - wie bereits erwahnt - die Schleife und die 
Addition benotigen gerade einnial T + 2 Taktzyklen. 

Fig. lib zeigt den groben Aufbau der einzelnen Funktionen 
(MACROS) in einem DFP. Die MACROS sind in ihrer etwaigen 
Lage und GroBe eingezeichnet und mit den anhand von Fig. 
11a erlauterten entsprechenden Nummern versehen. 

Fig. 11c zeigt den groben Aufbau der einzelnen Funktionen 
auf die RAM-Blocke 1 und 2: Die Summanden werden nach- 
einander in auf steigender Reihenfolge aus den RAM-Blocken 1 
und 2 ab Adresse lOOOh beziehungsweise OdfaOh gelesen und 
in RAM-Block 1 ab Adresse lOOah gespeichert. Zudem sind die 
ZShler47 und 49 gegeben, beide zahlen wahrend des Ablaufs 
der Schaltung von 0 bis 9. 

Nach Beendigung des beschriebenen Prograitims soil ein neues 
Programm geladen werden, das die Ergebnisse weiterverwer- 
tet. Die Umladung soil zur Laufzeit erfolgen. Das Programm 
ist im Folgenden gegeben: 



Es existieren die Zahlenreihen An und Bn, wobei An durch 
das Ergebnis Cn des vorher ausgefiihrten Programms gegeben 
ist : 



n: 0<=n<=9 

Es sollen die Produkte Ci=Ai*Bi mit I^N gebildet werden. 
const n=9 



1==A*B; . 

next ; 

Die Beschreibung der einzelnen Befehle ist bereits bekannt, 
* symbolisiert die Multiplikation , 

Die MACRO-Struktur ist in Fig. i8a beschrieben, Fig. 18b 
gibt in bekannter Weise die Lage und Grofie der einzelnen 
MACROS auf dem Chip an, besonders zu beachten ist die GroBe 
des Mulitplizierers 2 in Vergleich zu Addierer 1 aus Fig. 
lib. In Fig. 18c ist erneut die Auswirkung der Funktion auf 
den Speicher aufgezeigt, Zahler 47 zahlt erneut von 0 bis 
9, d.h, er wird beim Nachladen der MACROS zuruckgesetzt • 

Besonders zu beachten ist der ZShler 49, Angenommen, das 
Umladen der MACROS betragt 10 Taktzyklen. Dann IMuft der 
zahler 49 von 9 auf 19, da der Baustein dynamisch umgeladen 
wird, d.h, nur die umzuladenden Telle werden gestoppt, der 
Rest arbeitet weiter. Das fUhrt nun dazu, daB der ZMhler 
wShrend des Programmablauf s von 19 auf 29 hochlSuft, (Hier- 




for i=0 to n with (A[i] 




' c[il ) 
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mit soil das dynamische unabhangige Umladen demonstriert 
werden, in jedem bisher bekannten Baustein wUrde der Zahler 
erneut von 0 auf 9 laufen, da er zuriickgesetzt wird) . 

Bei naherer Betrachtung des Problems stellt sich die Frage, 
varum nicht beide Operationen, die Addition und die Multi- 
plikation in einem Zyklus durchgef iihrt werden, also die 
Operation; 

Es existieren die Zahlenreihen An und Bn, wobei An durch 
das Ergebnis von Cn des vorher ausgefiihrten Programms gege- 
ben ist: 

V n: 0<=n<=9 

Es sollen die Produkte Ci= (Ai+Bi) *Bi mit I€N gebildet 
werden . 



path D; 
const n=9; 

array A[nl in RAM [l], at lOOOh 
array B|n] in RAM [2J at OdfaOh 
array C [n] in RAM [l] at lOOah 

for i=0 to n with (A [i] , B [i] , C [i] ) 
& 1; 

D« A l=AbB; 
C=t& 1:=D*B; 

next ; 

path D definiert einen internen nicht aus den DFP herausge- 
fUhrten Doppelpfad. Die Operation benotigt wegen einem zu- 
s£itzlichen 1 einen Taktzyklus mehr aus vorher, ist ins- 
gesamt jedoch schneller als die beiden obigen Programme in 
Folge ausgef iihrt, da zum einen die Schleife nur einmal 
durchlaufen wird, zum zweiten nicht umgeladen wird. 



Prinzipiell konnte das Programm auch so formuliert werden 
const n=9; 



6 i; 

C=^2=(A-fB)*B; 

next ; 

Sind die Gatterlauf zeiten des Addierers und des Mulitpli- 
zierers zusammen Kleiner als ein Taktzyklus, kann die Ope- 
ration (A+B)*B auch in einem Taktzyklus durchgefuhrt wer- 
den, was zu einer weiteren erheblichen 
Geschwindigkeitssteigerung f iihrt : 

const n=9; 

array A[n^ in RAm[i] at lOOOh 

array B[n\ in RAM [2] at OdfaOh 

array c[n"^ in RAM [l] at lOOah 

for i=0 to n with (A[i] , B [i] , C [i] ) 
A 1; 

C= A 1=(A+B) *B; 

next ; 

Anhand von Fig. 12 soil ein einfaches Beispiel eines Zel- 
lenaufbaus erlautert werden. Die Zelle 10 umfaBt zum Bei- 
spiel ein UND-Glied 51, ein ODER-Glied 52, ein XOR-Glied 
53, einen Inverter 54 sowie eine Registerzelle 55. Die Zel 
le 10 weist dariiberhinaus eingangsseitig zwei Multiplexer 
56, 57 mit (den sechzehn Eingangen der Zelle entsprechend 
Fig. 6) zum Beispiel je sechzehn EingangsanschlUssen INI, 



array A[n3 in RAM [ij at lOOOh 
array B [n] in RAM [2J at GdfaOh 
array C[n] in RAM [ij at lOOah 



for i=0 to n with 




IN 2 auf. Uber diesen (16: l) -Multiplexer 56 / 57 werden 
jeweils die den genannten logischen Gliedern UND, ODER, XOR 
51 ..• 53 zuzufiihrenden Daten ausgewahlt. Diese logischen 
Glieder sind ausgangsseitig mit einem ( 3 : 1) -Multiplexer 58 
gekoppelt, der seinerseits mit dem Eingang des Inverters 
54, einem Eingang der Registerzelle 55 und einem weiteren 
(3: 16) -Multiplexer 59 gekoppelt ist. Der letztgenannte 
Multiplexer 59 ist zusatzlich mit dem Ausgang des Inverters 
54 und einem Ausgang der Registerzelle 55 verbunden und 
gibt das Ausgangssignal OUT ab. 

Der VollstSndigkeit halber sei angemerkt, daB die Register- 
zelle 55 mit einem Reset-Eingang R und einem Takteingang 
gekoppelt ist, 

Dem im vorstehenden erlauterten Zellenauf bau, d.h. der 
Zelle 10 ist nun eine Ladelogik 30 ubergeordnet, die mit 
den Multiplexern 56, 57, 58 und 59 verbunden ist und diese 
den gewiinschten Funktionen entsprechend ansteuert. 

Sollen zum Beispiel die Signale A2 mit B5 verundet werden, 
so werden die Multiplexer 56, 57 den Leitungen "ZWEI" be- 
ziehungsweise "fOnf" entsprechend aktiv geschaltet; die 
Summanden gelangen dann zum UND-Glied 51 und werden bei 
entsprechender Aktivierung der Multiplexer 58, 59 am Aus- 
gang OUT abgegeben. Soli zum Beispiel eine NAND-Verkniipf ung 
durchgefUhrt werden, so schaltet der Multiplexer 58 zum In- 
verter 54 und am Ausgang OUT steht dann das negierte UND- 
Ergebnis an. 
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VORB08 (VORB05) Martin VORBACH 

"Datenf luftprozessor II" 76137 Karlsruhe 

Datenverarbeitungseinrichtung 

PATENTANSPRUCHE 

1 . Datenverarbeitungseinrichtung , 

wobei ein (im folgenden Datenf luftprozessor - DFP - 
genannter) integrierter Schaltungskreis (Chip) mit 
einer Vielzahl insbesondere orthogonal zueinander an- 
geordneter homogen struJcturierter Zellen mit je einer 
Mehrzahl jeweils logisch gleicher und strukturell iden- 
tisch angeordneter Bausteine vorgesehen ist, 
dessen Zellen zeilen- und spaltenweise, gegebenenf alls 
gruppenweise zusammengefafit , mit Ein- / Ausgangs- 
anschlUssen des integrierten Schaltkreises verbunden 
sind, 

dadurch gekennzeichnet , 
, , daB den Zellen eine Ladelogik zugeordnet ist, uber die 
sie je fur sich und gegebenenf alls gruppenweise zusam- 
mengefaBt so programmierbar (konf igurierbar) sind, daB 
beliebige logische Funktionen und/oder Vernetzungen 
untereinander verif izierbar sind, und zwar derart, 
daB eine Manipulation der DFP-Konf iguration wahrend des 
Betriebes (oder zur Laufzeit) , d.h. die Modifikation 
funktioneller Telle (MACROS) des DFPs erfolgen kann, 
ohne daB andere funktionelle Telle angehalten werden 
miissen oder in ihrer Funktion beeintrachtigt werden, 

2. Datenverarbeitungseinrichtung nach Anspruch 1, 
dadurch gekennzeichnet, 



daS die Ladelogik mit Speichermitteln gekoppelt ist, 
Uber die die Konf iguration der Zellen spezif izierbar 
ist. 

Datenverarbeitungseinrichtung nach einem der Anspriiche 
1 bis 2, 

dadurch gekennzeichnet , 

da6 die Ladelogik aus einem Prozessor besteht, der den 
gesamten Programmablauf auf der Grundlage von in ver- 
schiedenen Speichern abgelegten Daten und Programmen im 
Sinne einer Harvard-Struktur verwaltet, 

Datenverarbeitungseinrichtung nach Anspruch 3, 
dadurch gekennzeichnet, 

daJJ die Ladelogik ihrerseits aus Zellen mit je einer 
Mehrzahl jewel Is logisch gleicher und strukturell 
identisch angeordneter Bausteine aufgebaut ist, 

Datenverarbeitungseinrichtung nach einem der Anspriiche 
1 Oder 4, 

dadurch gekennzeichnet, 

dafi die Zellen dynamisch wahrend eines Programmablauf s 
umkonf igurierbar sind, ohne dal3 die zu bearbeitenden 
Daten selbst beeinflu3t werden. 

Datenverarbeitungseinrichtung , 

wobei ein (im folgenden Datenf lu/3prozessor - OFF - 
genannter) integrierter Schaltungskreis (Chip) mit 
einer Vielzahl insbesondere orthogonal zueinander an- 
geordneter homogen strukturierter Zellen mit je einer 
Mehrzahl jeweils logisch gleicher und strukturell iden- 
tisch angeordneter Bausteine vorgesehen ist, 
dessen Zellen zeilen- und spaltenweise, gegebenenf alls 
gruppenweise zusammengef aBt, mit Ein- / Ausgangs- 
anschllissen des integrierteh Schaltkreises verbunden 
sind, 
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dadurch gekennzeichnet, 

dafi eine Mehrzahl von ihnen in Kaskadenf orm koppelbar 
sind, 

7, Datenverarbeitungseinrichtung nach einem der Ansprliche 
1 bis 6, 

gekennzeichnet durch, 

die Zuordnung geeigneter Daten-Ein- / Ausgabe-Einheiten 
und mindestens eines Speichers zum Aufbau eines (kom- 
plexen, kompletten) Rechenwerks, 

8. Datenverarbeitungseinrichtung nach einem der Ansprtiche 
1 bis 7, 

dadurch gekennzeichnet, 

dafi die Funktionen der Ein- / Ausgabeeinheiten partial 1 
im integrierten Schaltkreis (Chip) imp lemen tier bar 
sind. 



